یافتن مسیر بهینه بین دو نقطه، به وسیله ترکیب الگوریتم های یادگیری تقویتی و طرح ریزی

پایان نامه
  • وزارت علوم، تحقیقات و فناوری - دانشگاه سیستان و بلوچستان - دانشکده ریاضی
  • نویسنده نکیسا کیانی
  • استاد راهنما امین راحتی
  • سال انتشار 1392
چکیده

یادگیری تقویتی، یکی از شاخه های مطرح یادگیری ماشین در هوش مصنوعی است که برای حل یک مسئله نیازی به شناخت کامل از محیط ندارد، زیرا مسئله را به صورت یک عامل خودمختار و هدفمند می شناسد که با یک محیط نامعین در ارتباط است و ادراکات عامل از محیط را به عنوان حالت واقعی محیط در نظر می گیرد. یکی از کاربردهای این نوع از یادگیری در مسیریابی می باشد. یافتن مسیر بهینه در محیط های بزرگ و پیچیده با این روش می تواند مشکل باشد. برای غلبه بر این ضعف، ترکیب یادگیری تقویتی با طرح ریزی که عمدتا جستجویی برای یافتن مسیر بهینه در فضای حالت است، الگوریتم های dyna را نتیجه می دهد که قادر هستند اطلاعات دریافتی را برای حالت های مجاور ارزیابی نمایند. در این پژوهش، به بررسی یک تکنیک طرح ریزی اکتشافی به نام dyna-h پرداخته شده است که توانایی جستجوی اکتشافی در مسیریابی را دارد. الگوریتم بررسی شده، با استفاده از الگوریتم یادگیری تقویتی، مسیر های مناسب تری را از بین کل مسیر های موجود انتخاب می کند. الگوریتم dyna-h را با دو الگوریتم مسیریابی یادگیری- q و dyna-q، از نظر میزان و سرعت یادگیری مورد مقایسه قرار داده و این نتیجه حاصل شد که dyna-h، در مسائل مسیریابی نتایجی به وضوح بهتر را فراهم می نماید. کلمات کلیدی: الگوریتم یادگیری- q، الگوریتم dyna-q، الگوریتم dyna-h ، مسیریابی، یادگیری تقویتی

منابع مشابه

یافتن کوتاهترین مسیر شبکه با استفاده از الگوریتم بهینه سازی فاخته در سیستم اطلاعات مکانی

امروزه مسیریابی در شبکه­های شهری با افزایش حجم اتومبیل­ها و نیز محدودیت­های ترافیکی گوناگون امری ضروری محسوب می­شود. روشی که در این پژوهش به منظور حل مسأله کوتاهترین مسیر برای نخستین بار پیشنهاد شده است، استفاده از الگوریتم بهینه­سازی فاخته می­باشد. علت انتخاب این الگوریتم، جدید بودن و نیز پاسخ مناسبی است که این الگوریتم برای حل مسأله مسیریابی، نسبت به سایر الگوریتم‍های فراابتکاری داده است. در ...

متن کامل

طراحی مسیر بهینه برای ربات فضایی شناور - آزاد در حرکت نقطه به نقطه به روش غیرمستقیم

در این مقاله روشی جدید براساس حل غیرمستقیم مسئلة کنترل بهینه برای طراحی مسیر بهینة ربات فضایی شناور - آزاد، در حرکت نقطه به نقطه ارائه شده است. برای این منظور، معادلات دینامیکی سیستم در کنار قیود غیرهولونومیک ناشی از برقراری قانون بقای ممنتم زاویه‌ای در فرم فضای حالت استخراج می‌شود. سپس با استفاده از قضیة اساسی حساب تغییرات، شرایط لازم بهینگی به‌دست می‌آید. معادلات حاصل به یک مسئلة مقدار مرزی د...

متن کامل

طرح بهینه مقطع اسکله های وزنی بلوکی با استفاده از روش برنامه ریزی درجه دو متوالی

در این مقاله، ابتدا روش طراحی و اجرای اسکله های ساحلی بلوکی تشریح می شود و پس از ارزیابی معیارها و راهکارهای ممکن جهت نیل به طرح بهینه این اسکله ها، تابع هدف، قیود و متغیرهای طراحی مناسب برای تشکیل یک مسأله بهینه سازی انتخاب و در ادامه به حل آن پرداخته می شود. قیود این مسأله بهینه سازی، تأمین ضرایب ایمنی پایدار مقطع در شکلهای مختلف گسیختگی است که رابطه آن با متغیرهای طراحی نامشخص است. در این تح...

متن کامل

طراحی مسیر بهینه برای رباتها بر مبنای یادگیری تقویتی

در دهه اخیر هوشمندسازی ربات ها مورد توجه بسیاری از پژوهشگران در زمینه مهندسی رباتیک و هوش مصنوعی قرار گرفته است. از چالش های پیشروی پژوهشگران در این زمینه ساخت ربات هایی است که دارای قابلیت یادگیری و تطبیق پذیری باشند. هدف از این پایان نامه استفاده از روش های یادگیری تقویتی برای طراحی مسیر بهینه برای ربات ها می باشد. در این مطالعه روشی نو برای یادگیری مسیر بهینه حرکت ربات های بازو از طریق تعامل...

ارائه یک الگوریتم برای یافتن کوتاه ترین مسیر در شبکه های حلقوی

برای یافتن کوتاه ترین مسیر بین هر دو گره در شبکه های دارای حلقه که در آن حداقل یک حلقه وجود دارد الگوریتم فلوید – وارشال (Floyd-warshall) به عنوان پرکاربردترین الگوریتم مطرح است. در این مقاله الگوریتم جدیدی با عنوان الگوریتم مستطیلی توسعه داده می شود که به طور قابل ملاحظه ای حجم محاسبات مورد نیاز را نسبت به الگوریتم فلوید وارشال کاهش میدهد. علاوه بر این روش ارائه شده ساده تر و قابل فهم تر از ال...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


نوع سند: پایان نامه

وزارت علوم، تحقیقات و فناوری - دانشگاه سیستان و بلوچستان - دانشکده ریاضی

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023